AMD Radeon AI Pro R9700 GPU cung cấp nhiều hơn 4 lần và hiệu suất AI cao hơn gấp 2 lần so với Radeon Pro W7800
AMD đã chia sẻ thêm thông tin về GPU Radeon AI PRO R9700 và so sánh khả năng AI với Radeon PRO W7800 hiện có. Radeon AI PRO R9700 cung cấp gấp 4 lần AI TOPS và hiệu suất AI tăng gấp đôi cho người tiêu dùng. AMD cũng đã mở rộng bộ phần mềm của mình với ROCm 7, trong đó chiến lược tăng cường AI hiện tại được chia thành ba danh mục chính: Ryzen AI MAX APUs cho LLM nhỏ và vừa, Radeon AI PRO GPUs cho suy luận multi-GPU LLM nhỏ và vừa, và cuối cùng là các bộ tăng tốc AI Instinct cho LLM lớn trong môi trường rack và đào tạo.
AMD đã công bố chi tiết về dòng MI350 và cung cấp thêm một số thông tin về sản phẩm Radeon AI PRO. Radeon AI PRO R9700 sử dụng GPU Navi 48 với 64 đơn vị tính toán (4096 bộ xử lý luồng), 128 bộ tăng tốc AI và công suất tối đa lên tới 300W. Về bộ nhớ, R9700 được trang bị 32 GB bộ nhớ GDDR6 trên bus 256-bit, gấp đôi VRAM của 9070 XT.
Các thông số hiệu suất khác được AMD chia sẻ bao gồm 96 TFLOPs tính toán FP16 và 1531 TOPS INT4 Sparse. Mục tiêu của GPU AMD Radeon AI PRO R9700 là hoàn thành hiệu quả các mô hình AI chất lượng cao. Đó là lý do nó được trang bị 32 GB VRAM, đủ cho hầu hết các tác vụ AI cục bộ tiên tiến như DeepSeek R1 Distill Qwen 32B Q6, Mistral Small 3.1 24B Instruct 2503 Q8, Flux 1 Schnel và SD 3.
AMD cho biết Radeon AI PRO R9700 nhanh gấp đôi Radeon PRO W7800 32 GB trong DeepSeek R1, và so với RTX 5080 (16 GB VRAM), R9700 có thể nhanh hơn tới 5 lần. Với 16 GB VRAM, RTX 5080 có thể không đủ cho các mô hình AI yêu cầu nhiều bộ nhớ. R9700 cung cấp hiệu suất tính toán cao với 47.
GPU này có hiệu suất 8 TFLOPs FP32, 191.4 TFLOPs FP16 BF16, 382.7 TFLOPs FP8, 382.7 TOPs INT8 và 765.5 TOPs INT4. Nó cũng hỗ trợ các lệnh WMMA (Wave Matrix Multiply Accumulate) và cấu trúc thưa thớt. Với tính năng thưa thớt, tổng số TOPS INT4 có thể đạt 1531. Các chỉ số FP16 tăng gấp đôi so với Radeon PRO W7800, trong khi INT8 và INT4 tăng gấp bốn lần. AMD nhấn mạnh tầm quan trọng của việc hỗ trợ các mô hình lớn để đạt được kết quả tốt hơn.
Trong lĩnh vực Text-To-Image, một mô hình 8B chạy trên FP16 sẽ cho kết quả tốt hơn nhiều so với mô hình 1B. Về khả năng suy luận, mô hình 32B 6-bit sẽ có độ chính xác cao hơn so với mô hình 8B 6-bit. AMD cũng đã trình diễn hiệu suất AI FP16 trong so sánh giữa R9700 và W7800, với biến thể mới cung cấp hiệu suất cao gấp hơn 2 lần trong DeepSeek R1 Distill Llama 8B. Hơn nữa, AMD Radeon AI PRO R9700 còn có thể mở rộng trong cấu hình Multi-GPU 4 chiều sử dụng PCIe 5 hiện đại.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
Nền tảng 0 cho phép người dùng sử dụng 128 GB bộ nhớ, có thể xử lý các mô hình buffer như Mistral 123B DeepSeek R1 70 B, tiêu tốn tới 112-116 GB VRAM. Cuối cùng, GPU AMD Radeon AI PRO R9700 sẽ có mặt vào tháng 7 năm nay thông qua các đối tác hàng đầu như ASUS, ASRock, Gigabyte, PowerColor, Sapphire, XFX và Yeston. Thẻ đồ họa này sẽ có thiết kế hai khe cắm với quạt làm mát.
Bạn có thể tham khảo mô hình ASRock trong danh sách dưới đây về các card đồ họa AMD Radeon Pro Workstation:
- Tên card: Radeon AI PRO R9700, Radeon Pro W7900, Radeon Pro W7800, Radeon Pro W6900X, Radeon Pro W6800, Radeon Pro VII, Radeon Pro W5700X, Radeon Pro W5700, Radeon Pro WX 9100, Radeon Pro WX 8200, Radeon Pro WX 7100
- GPU: Navi 48, Navi 31, Navi 31, Navi 21, Navi 21, Vega 20, Navi 10, Navi 10, Vega 10, Vega 10, Polaris 10
- Quy trình sản xuất: 4nm, 5nm, 6nm, 5nm, 6nm, 7nm, 7nm, 7nm, 7nm, 7nm, 14nm, 14nm, 14nm
- Đơn vị tính toán: 64 CU, 96 CU, 70 CU, 80, 60, 60, 40, 36, 64, 56, 36
- Bộ xử lý luồng: 4096, 6144, 4480, 5120, 3840, 3840, 2560, 2304, 4096, 3584, 2304
Tần số: 5 GHz, 2.5 GHz, 2171 MHz, 2320 MHz, 1700 MHz, 2040 MHz, 1930 MHz, 1500 MHz, 1500 MHz, 1243 MHz.
VRAM: 32 GB GDDR6, 48 GB GDDR6, 32 GB GDDR6, 32 GB GDDR6, 32 GB GDDR6, 16 GB HBM2, 16 GB GDDR6, 8 GB GDDR6, 16 GB HBM2, 8 GB HBM2, 8 GB GDDR5.
Băng thông bộ nhớ: 640 GB/s, 864 GB/s, 576 GB/s, 512 GB/s, 512 GB/s, 1024 GB/s, 448 GB/s, 448 GB/s, 512 GB/s, 484 GB/s, 224 GB/s.
Bus bộ nhớ: 256-bit, 384-bit, 256-bit, 256-bit, 256-bit, 4096-bit, 256-bit, 256-bit, 2048-bit, 2048-bit, 256-bit.
Tốc độ tính toán FP32: 48 TFLOPs, 61 TFLOPs.
Dưới đây là phiên bản ngắn gọn bằng tiếng Việt:
- Hiệu suất: 3 TFLOPs, 45.2 TFLOPs, 22.23 TFLOPs, 17.82 TFLOPs, 13.1 TFLOPs, 9.5 TFLOPs, 8.89 TFLOPs, 12.3 TFLOPs, 10.8 TFLOPs, 5.7 TFLOPs
- TDP: 300W, 295W, 260W, 300W, 250W, 250W, 240W, 205W, 250W, 230W
- Giá: TBD, 3999 USD, 2499 USD, 5999 USD, 2249 USD, 1899 USD, 999 USD, 799 USD, 2199 USD, 999 USD, 799 USD
- Thời gian ra mắt: 2025, 2023, 2023, 2021, 2021, 2020, 2019, 2019, 2017, 2018, 2016
Nguồn: wccftech.com/amd-radeon-ai-pro-r9700-gpu-4x-more-tops-2x-ai-performance-vs-radeon-pro-w7800/